<?php
//header('content-type:text/html;charset=gbk');

$page = file_get_contents('http://lusongsong.com/');
//print_r($page);

//s是将字符串视为单行，在这里，如果加上s，.就能匹配到换行符了
// 采集到了列表的ul
$preg = '/<ul class=\"ulcl\">.*?<\/ul>/si';
preg_match_all($preg,$page,$listarr);

//采集具体列表项的正则规则

$preg2 = '/<li>.*?<strong>.*?<\/strong>.*?<a href="(.*?)" target="_blank">.*?<\/li>/is';
//将匹配到的li存到liarr里
preg_match_all($preg2,$listarr[0][0],$liarr);


//获得当前页面所有的新闻页的地址
$news_list = $liarr[1];

//print_r($news_list);


//循环所有地址，采集地址中的标题和内容
foreach($news_list as $k=>$v){
//     抓取当前页面的源代码
        $newspage = file_get_contents($v);
//        匹配标题的规则
        $preg_title = '/<h1>.*?<\/h1>/';
        preg_match_all($preg_title,$newspage,$newsarr);
//        print_r($newsarr);

}







